Objetivos de Aprendizagem
- Compreender a hierarquia da memória da GPU e suas características de latência
- Identificar padrões para agrupamento de memória global
- Implementar estratégias de tile em 1D e 2D usando memória compartilhada
- Analisar e mitigar conflitos de bancos de memória compartilhada
- Comparar os ganhos de desempenho entre implementações com tile e sem tile